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摘 要 以 蛋白 质 酷 氨 酸 磁 酸 酶 为 模型 ， 通 过 序列 和 结构 的 比较 ， 对 和 蛋白质 序列 、 结 构 的 保守 性 与 其 功能 
和 进化 的 关系 问题 进行 了 研究 。 结 果 显 示 ， 虽 然 在 酷 气 酸 磷酸 酶 超 家 族 分 子 的 序列 中 ， 仅 有 3 个 与 其 催化 功能 
密切 相关 的 残 基 是 高 度 保守 的 ， 但 它们 功能 结构 域 的 核心 拓 扩 结构 却 明显 类 似 ， 其 中 存在 着 poh 和 BoBa 2 个 
保守 的 结构 单元 ; 此外， 它们 活性 位 点 的 拓扑 结构 也 极其 相似 。 因 此 ， 在 保持 蛋白 质 功能 方面 具有 重要 作用 的 
残 基 是 高 度 保 守 的 ， 而 具 维持 蛋白 质 结构 作 用 的 残 基 则 是 相对 保守 的 。 在 进化 过 程 中 ， 蛋 白质 三 维 拓 扑 结构 的 
保守 性 ， 似 乎 主要 是 体现 在 保持 某 些 共 同 的 特有 二 级 结构 单元 和 共同 的 折 秋 方式 上 。 
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蛋白 质 序列 - 结构 -功能 的 关系 问题 是 结构 分 
子 生物 学 的 核心 问题 之 一 。 大 量 研究 表明 ， 虽 然 在 
同 源 蛋 白质 家 族 中 ， 相 似 序列 的 蛋白 质 具 有 相似 的 
结构 和 功能 、 但 是 ,在 许多 蛋白质 超 家 族 中 ， 诺 列 
差异 很 大 的 蛋白 质 分 子 却 也 具有 明显 类 似 的 结构 和 
功能 ， 这 使 得 单纯 的 “序列 决定 结构 ， 结 构 决 定 功 
能 ”的 传统 观念 正 受 到 严 贱 地 挑战 。 许 多 研究 显 
示 ， 蛋 白质 序列 及 其 结构 的 保守 性 ， 既 是 其 分 子 功 
能 约束 的 结果 ， 也 是 其 分 子 进化 的 结果 。 为 了 探讨 
在 分 子 进化 过 程 中 ， 和 蛋白 质 序列 一 结构 ~ 功能 的 关 
系 ， 有 必要 就 蛋白 质 序列 与 结构 的 保守 性 做 进一步 
地 分 析 研 究 。 

AEH, ROWER ARAM (protein 
tyrosine phosphatase, PIP) 作为 模型 ， 通 过 对 其 序列 
和 结构 的 比较 研究 ， 结 合 有 关 生 物化 学 和 分 子 生物 
学 的 研究 结果 ， 讨 论 了 PTP 序列 和 结构 的 保守 人 性 
与 其 功能 的 关系 ， 旨 在 为 进一步 研究 蛋白 质 序列 -~ 
结构 - 功能 的 关系 提供 一 些 启示 和 信息 。 


1 材料 与 方法 


本 研究 所 涉及 的 PTP 序列 及 三 维 结构 数据 ， 
4 BR A Brookhaven 的 蛋白 质数 据 库 (PDB)。 序 
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列 和 结构 的 比较 主要 针对 功能 结构 域 进行 。 结 构 域 
的 划分 用 DIAL 程序 【Sowdhamini 等 ，1995) if 
行 。 在 通过 用 MNYFIT 程序 (Sali 等 ，1990) 对 
PTP 的 功能 结构 域 进行 结构 重 倒 后 、 再 运用 COM- 
PARER 程序 (Sutcliffe 等 ，1987) 进行 基于 结构 
的 序列 联 配 。 为 了 能 对 PTP 整个 功能 结构 域 的 序 
列 进行 联 配 ， 序 列 中 的 一 些 较 大 的 插 人 已 被 删除 。 
结构 重 羡 图 通过 运用 RasMol 程序 绘制 ， 联 配 后 的 
序列 用 JOY 程序 (Overington 等 ,1990，1992) 进 
行 表 示 。 


2 结 果 


Iphr, 2hnq, lypt 和 lvhr 的 结构 比较 表明 ， 
在 lphr 核心 结构 中 的 B 一 片 层 结构 的 顺序 不 同 于 
2hnq、1ypt 和 1vhr 的 。1phr 核心 结构 中 ， 含 4 个 
平行 的 B 一 片 层 结构 片段 ， 其 顺序 为 R2 -p-e 
一 由 ; 其 余 3 种 PTP 则 有 5 个 与 此 顺序 不 同 的 B— 
片 层 结构 片段 ,并且 其 中 有 1 个 8 一 片 层 结构 片 眉 
与 其 他 的 4 个 反 平行 ， 而 此 反 平 行 的 8~ 片 层 结构 
片段 在 1phr 却 不 存在 。 

lphr 活性 位 点 氨基 酸 顺 序 的 位 置 与 2hnq、 
1ypt 和 lvhr 的 有 很 大 差异 ，1lphr 的 活性 位 点 片段 
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(C-Xs-R) 位 于 其 N- 示 端 ， 而 其 余 3 种 磷酸 酶 
的 则 位 于 C 一 末端 。 然 而， 二 者 的 活性 位 点 及 含 
Asp 环 的 基本 拓扑 结构 却 是 相同 的 。 为 了 使 1phr 
的 序列 能 够 与 2hnq、1ypt 和 1vhr 的 联 配 ， 我 们 将 
lphr N -端的 1 一 34 残 基 切 下 ， 并 将 其 接 至 C 一 末 
端 ， 经 过 这 样 的 处 理 ， 我 们 对 这 4 种 磷酸 酶 进行 了 
结构 重 登 〈 图 1) 并 得 到 了 它们 的 序列 联 配 图 【图 
2)。 





tt Ca 一 原子 的 结构 重合 部 分 ， 它们 之 间 的 均 方 根 
(RMS) 误差 分 别 为 : 1.65 x 10° m, 1.45 x 
10° m 11.5310 "m, 并 且 在 核心 结构 中 有 
BoB 和 Bofe 2 个 保守 的 结构 单元 (图 2)。1phr 与 
2hnq、lypt 和 1vhr 等 价 的 绝 大 多 数 残 基 分 布 于 这 
些 保守 的 B- 和 a- 结构 片段 中 。 此 外 ,不仅 lphr 
中 与 磷酸 相 结 合 的 环 的 拓扑 结构 与 2hnq、1ypt 和 
lvhr 的 非常 相似 ， 而 且 它们 活性 中 心 的 拓扑 结构 
也 能 很 好 地 重合 图 3)。 





图 1 MRR RBMAN HR LE RAE EE 
Fig. 1 Structures of core regions and superposition 
in protein tyrosine phosphatases 
a: 2hnq 核心 区 域 的 结构 《2hnq core structure); b; lypt 
核心 区 域 的 结构 《1ypt core structure); c; 1vhr 核心 区 域 
的 结构 《1vhr core structure); d; Iphr 核心 区 域 的 结构 
《lphr core structure); e: 酷 氨 酸 碳酸 酶 结构 核心 区 域 的 重 
Æ 比较 (superposition of core regions in protein tyrosine 

phosphatases}. 


虽然 1phr 与 2hnq、1ypt 和 lvhr 的 序列 一 致 性 
IRIE (<15%), 但 它们 却 保留 着 1 个 共同 的 C- 
Xs 一 R 特征 活性 位 点 片段 和 1 个 保守 的 Asp 残 基 
( 即 lphr 的 Asp129， 它 相应 于 2hnq 的 Asp181) 
(图 2)。 已 有 研究 表明 ,这 3 个 保守 的 残 基 都 与 磷 
酸 酶 的 功能 密切 相关 (Stone 等 ，1994; Su 等 ， 
1994; Barford 4, 1995). 1phr 与 2hnq. lypt 及 


lvhr 的 三 维 拓扑 结构 也 很 类 似 〈 图 1), 在 50 个 等 


图 3 MARREN EAR E E E 
Fig. 3 The view of the protem tyrosine phosphatase 
active site superposition 
a; 2hnq; b; lypt; c; lvhr; d: 1phra 


3 讨论 


重 白 质 中 酷 氮 酸 的 磷酸 化 与 去 磷酸 化 ， 在 调控 细 
胞 的 分 裂 、 分 化 和 发 育 等 信号 传递 过 程 中 ， 具 有 重要 
的 作用 。 磷 酸化 与 去 磅 酸化 作用 分 别 由 蛋白 质 激酶 和 
磷酸 酶 来 催化 ，PTP 则 是 催化 其 蛋白 质 底 物 中 磷酸 化 
的 酷 氨 酸 去 磷酸 化 。 在 催化 水 解 磷酸 单 酯 的 过 程 中 ， 
PTP 以 1 个 Gs 残 基 作 为 亲 核 试剂 ， 并 且 形 成 一 个 磁 
-Cys 的 中 间 产 物 (Guan 等 ，1991)。 通 常 ，PTP 被 
分 成 两 个 超 家 族 ， 即 和 蛋白质 磷 酸 酶 TP 和 I。 磷 酸 酶 I i 
RA—MES TRH RRARBRM (imwPIP) 家 
族 ; 而 磷酸 酶 [ 则 包括 两 个 家 族 ， 一 个 是 高 分 子 量 磷 
酯 氨 酸 磷酸 酶 ， 另 一 个 为 双重 专 一 性 磷酸 酶 。 截 止 
1997 年 底 ， 在 PDB 中 已 收录 三 维 晶体 结构 数据 的 
PIP #4 4 种 ， 即 tmwPTP (1phr), PTPIB (2hng). 
Yersinia PIP (lypt) 和 双重 专 一 性 磷酸 酶 【lvhr)。 
这 4 种 酶 中 ，2bhnq 和 1ypt 属于 高 分 子 量 磷 酷 氨 酸 磷酸 
酶 家 族 ，1vhr 属 双重 专 一 性 磷酸 酶 家 族 ， 这 3 种 酶 同 
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图 2 ARRA PTR E 
Fig. 2 The sequence alignment of protein tyrosine phosphatases 
FER: 磷酸 酶 的 特征 序列 片段 ; RAR: TRA, a，a 一 螺旋 片段 ; B: 一 片 屋 片 段 ; 序列 中 各 种 符号 所 表示 残 基 的 不 
同 构象 及 性 质 分 别 为 ，X: PKA ROR, x: 溶剂 可 及 的 残 基 ; r: 正中 构象 角 残 基 ，x-: 与 其 他 侧 链 成 所 键 的 残 基 ; 
I: 与 主 链 的 酰 所 成 氢 键 的 残 基 ; x: JEANEN (bon: signature motif; arrows: conserved residues; a; ohe- 
lx elements; 8; Bsheet elements; residues in the alignment are represented as follows, X; solvent inaccessible; x; solvent aocessi- 


ble; z: posttiveh; x: hydrogen bond to other sidechain; 
carbonyl}. 


RARE I BAK, m 1phr MRAR I BKK. 

Iphr 和 2hng、1ypt 及 lvhr 不 仅 具 有 类 似 的 三 
维 结构 、 共 同 的 特征 性 活性 位 点 片段 和 一 个 具 众 化 
活性 的 保守 的 Asp RH, 而且 它们 还 有 共有 相同 的 
反应 众 化 机 制 ， 包 括 相 同 的 — Cys 中 间 产 物 和 惧 
LEMS, Al, ARE SIRT Ae 
白质 超 家 族 ， 至 于 它们 序列 间 的 较 大 差异 ， 则 可 能 
是 长 期 进化 的 结果 。 

蛋白 质 序列 、 结 构 与 功能 间 的 关系 ， 至 今 仍 不 
完全 清楚 ，- -方面 ， 序 列 高 度 -- 致 的 蛋白 质 ， 其 结 
构 和 功能 高 度 相似 ; 另 一 方面 、 一 些 序列 一 致 性 较 
低 的 和 蛋白质 却 也 具有 类 似 的 结构 和 功能 ， 如 2hnq、 
1ypt、lvhr 和 lphr。 因 此 ， 和 蛋白 质 序 列 、 结 构 与 功能 
的 关系 并 不 是 一 种 线性 的 关系 。 目 前 PDB 中 已 有 三 
维 结构 数据 的 蛋白 质数 自己 超过 7000， 而 至 今 尚未 


x: hydrogen bond to mainchain amide; x; hydrogen bond to mainchain 


发 现 有 两 种 不 同和 蛋白 质 分 子 的 序列 是 完全 一 致 的 。 
然 耐 ， 通 过 对 和 蛋白质 结构 的 分 类 比较 研究 发 现 ， 所 
有 已 知 三 维 结构 的 和 蛋白质， 大致 可 分 为 全 a、 全 BB、 
gt+B 和 a 从 4 个 大 类 、327 种 折 秋 方式 、463 个 超 
家 族 和 652 个 家 族 (Brenner 等 ，1997)。 毫 无 疑 
间 ， 蛋 白质 的 结构 类 型 数 远 远 低 于 它 的 种 类 数 。 一 
般 来 讲 ， 同 一 家 族 中 的 蛋白 质 功能 是 相同 的 ， 甚 至 
有 些 同 一 超 家 族 中 的 和 蛋白质 功能 也 是 相同 的 。 而 目 
前 已 知 三 维 结构 的 所 有 蛋白质 仅 652 个 家 族 ， 显 然 
大 大 少 于 和 蛋白质 的 种 类 数 。 因 此 ， 在 分 子 进化 过 程 
中 , 不 仅 和 蛋白 质 的 三 维 结构 较 其 序列 更 为 保守 
(Bajaj 等 ，1984)》， 实 际 上 ， 和 蛋白 质 的 功能 也 是 高 
度 保 守 的 。 然 而 ， 从 某 种 意义 上 讲 ， 结 构 与 功能 间 
的 关系 ， 似 乎 没有 功能 与 序列 中 若干 重要 残 基 的 关 
系 那 么 严格 。 许 多 研究 显示 ， 仅仅 1 个 残 基 的 替 
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换 ， 就 可 能 导致 蛋白 质 功能 的 完全 丧失 或 显著 降 
低 ; 而 序列 差异 很 大 的 不 同 蛋白 质 分 子 ， 则 既 可 具 
有 非常 类 似 的 结构 和 相同 的 功能 ， 也 可 具有 功能 相 
差 其 远 的 某 种 相似 结构 。 一 种 类 似 的 结构 单元 可 以 
由 不 同 的 序列 片段 构成 ， 例 如 ， 磷 酸 酶 中 由 不 同 氨 
基 酸 顺序 组 成 的 Bop 结构 单元 ， 也 存在 于 脱 气 酶 、 
黄 氧 还 蛋白 和 激酶 等 蛋白 质 中 。 因 此 ， 蛋 白质 的 三 
维 结构 也 许 主要 是 受 物理 、 化 学 和 几何 因素 的 约 
束 ， 而 不 是 主要 受 其 序列 的 约束 。 

在 进化 过 程 中 ， 维 持 蛋 白质 结构 的 残 基 不 如 保 
持 蛋 白质 功能 的 残 基 保 守 【〈 黄 京 飞 等 ，1998)。 目 
前 ， 几 乎 所 有 关于 序列 与 结构 比较 的 研究 都 支持 这 
样 的 观点 : 对 于 功能 重要 的 残 基 是 保守 的 ， 并 且 位 
于 拓扑 结构 的 等 价位 置 (OQverington 等 ，1990， 
1992)。 然 而 ， 蛋 白质 三 维 拓扑 结构 的 保守 性 ， 则 
似乎 主要 体现 在 保持 某 些 共 同 的 特有 二 级 结构 单元 
和 折 肥 方式 上 。 例 如 来 自 226 种 球 蛋 白 序列 和 结构 
的 比较 表明 ， 虽 然 它 们 的 三 维 拓扑 结构 非常 相似 ， 
但 其 中 有 的 序列 的 一 致 性 却 只 有 16% ， 而 且 在 所 
有 的 序列 中 公有 2 个 残 基 是 保守 的 ， 但 在 进化 中 几 


乎 所 有 的 -螺旋 结构 片段 都 得 以 保存 下 来 〈《Bash- 
ford 等 ，1987); Æ PTP F, ERE 3 TREER 
守 的 ,但 其 核心 结构 中 却 保 留 了 Bop 和 Boge 2 个 
保守 的 结构 单元 ， 尽 管 组 成 这 2 个 结构 单元 的 残 基 
不 尽 相 同 。 因 此 ， 我 们 认为 ， 蛋 白质 的 拓扑 结构 对 
于 保持 蛋白 质 的 功能 是 重要 的 ， 不 同 的 拓扑 结构 将 
导致 不 同 的 功能 。 虽 然 拓 扑 结构 对 于 保持 功能 是 必 
要 的 , 但 仅 只 是 拓扑 结构 还 不 足以 保证 蛋白 质 功能 
的 实现 。 在 福 足 某 种 蛋白 质 特定 功能 所 要 求 的 拓扑 
结构 的 前 提 下 ， 一 些 关 键 残 基 的 存在 ， 将 是 蛋白 质 
功能 得 以 实现 的 重要 因素 。 因 上 ,对 于 保持 蛋白 质 
功能 非常 重要 的 残 基 是 高 度 保 守 的 。 但 是 ， 维 持 蛋 
白质 结构 的 残 基 则 是 相对 保守 的 ， 因 为 它们 可 以 在 
蛋白 质 结构 的 任何 位 置 上 ， 从 几 个 不 同 的 “候选 ” 
残 基 中 选择 其 中 之 一 。 
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THE RELATIONS OF PROTEIN SEQUENCE AND STRUCTURAL 
CONSERVATION WITH FUNCTION 
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Abstract The conservation in sequence and structure 
of protein tyrosine phosphatases has been analyzed by 
aligning their sequences and superposed their three-di- 
mensional topological structures. The results indicated 
that only three residues related closely to the function 
are conserved in sequence, but the core regions in their 
functional domains are strikingly similar in structure, 
and there are two conserved structural motifs, i. e., 
Raf and Baße motifs. On the other hand, the topology 


of the active site in protein tyrosine phosphatases is al- 
so very similar. Thus, it is suggested that the very im- 
portant residues for maintaining protein function are 
highly conserved, however, the residues for keeping 
protein structure are conservatively varied. In molecu- 
lar evolution, three-dimensional structural conservation 
seems to be mainly expressed in holding some common 
secondary structural elements and common fold. 
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